ROI рекламы в приложении Procrastinate Pro+.


Загрузка и предобработка данных

Датафрейм visits состоит из колонок:

Для соблюдения стилистического правила, приведем название колонок к нижнему регистру.

Датафрейм состоит из 6 колонок и 309901 строк. В колонках с датами необходимо поменять формат на datetime.

Исправили формат.

Пропусков не обнаружено.

Дубликатов не обнаружено.

Датафрейм orders состоит из:

Для соблюдения стилистического правила, приведем название колонок к нижнему регистру.

Датафрейм состоит из 3 колонок и 40212 строк. В колонках с датами необходимо поменять формат на datetime.

Исправили формат.

Пропусков не обнаружено.

Дубликатов не обнаружено.

Датафрейм costs состоит из:

Для соблюдения стилистического правила, приведем название колонок к нижнему регистру.

Датафрейм состоит из 3 колонок и 1800 строк. В колонках с датами необходимо поменять формат на datetime и округлить до даты.

Пропуски не обнаружены.

Дубликаты не обнаружены.

Функции для расчёта и анализа LTV, ROI, удержания и конверсии.

Функции для вычисления значений метрик

Функция get_profiles()
Функция get_retention()
Функция get_conversion()
Функция get_ltv()

Функции для построения графиков

Функция filter_data()
Функция plot_retention()
Функция plot_conversion()
Функция plot_ltv_roi

Исследовательский анализ данных

Профили пользователей

Используя функцию get_profiles составили таблицу профилей пользователей приложения.

Отпеределили минимальную (01 мая 2019) и максимальную (27 октября 2019) даты привлечения пользователей. Они соответствуют интервалу указанному в задаче.

Распределение по странам

Напишем функцию для расчета распределения по таблице profiles.

Пользователи распределились по 4 регионам следующим образом:

Построим график для наглядной визуализации наших наблюдений. К сожалению показатель платильщиков шлишком мал, чтоб его значения считывались из визуализации.

Распределение по используемым устройствам

Пользователи распределились по 4 устройствам следующим образом:

Построим график для визуализации наших наблюдений. IPhone отчетливо выделяется, как по общему количеству, так и количеству платильщиков.

Распределение по каналам привлечения

Пользователи распределились по 11 каналам привлечения следующим образом:

Построим график для визуализации наших наблюдений. Количество пользователей пришедших без рекламы (organic) заметно больше остальных, но платильщиков пришедших от FaceBoom и TipTop больше.

Дополнительно посмотрим на распределение пользователей по странам и каналам привлечения. Видим, что каналы TipTop, FaceBoom, MediaTornado, YRabbit и RocketSuperAds работают только в United States. Остальные каналы относятся к Европе.

Промежуточные итоги в части исследования профилей

Маркетинг

Расходы на маркетинг

Распределение расходов на маркетинг по каналам привлечения

Расходы по каналам привлечения распределились следующим образом:

Визуализируем наши наблюдения на графике.

Динамика изменений расходов во времени

На графике динамики расходов по каналам привлечения видим, что в разрезе недельного показателя, лидер TipTop показывает высокую валатильность, чуть большую стабильность показывает канал FaceBoom, у остальных расходы больее стабильные.

Стоимость привлечения одного ползователя (САС)

По показателю САС мы видим, что стоимость привлечения у тройки лидеров, выше 1, а у лидера TipTop цена значительно выше и составляет 2,79.

В дальнейшем анализе нас будут интересовать только пользователи привлеченные по платным каналам, поэтому organic исключим из выборки.

Посчитали общий показатель САС, он составляет 1.12, что говорит об общей убыточности.

Промежуточные итоги в части маркетинга

Анализ окупаемости рекламы

Анализ окупаемости рекламы c помощью графиков LTV и ROI, а также графиков динамики LTV, CAC и ROI

Из графиков можно сделать вывод:

Анализ окупаемости рекламы по устройствам

По данным графиков окупаемости по устройствам, можно сделать вывод:

Анализ окупаемости рекламы по странам

На графиках окупаемости по странам можем наблюдать:

Анализ окупаемости рекламы по каналам привлечения

На графиках окупаемости по каналам привлечения можем наблюдать:

Промежуточные итоги в части окупаемости

Проверка конверсии и удержания пользователей в динамике

Конверсия и удержание по устройствам

По конверсии можем наблюдать:

По графику удержания можно сделать вывод:

Конверсия и удержание по каналам привлечения

По конверсии можем наблюдать:

По графику удержания можно сделать вывод:

Конверсия и удержание по регионам

По конверсии можем наблюдать:

По графику удержания можно сделать вывод:

Промежуточные итоги в части конверсии и удержания

Проверка гипотизы

На основании нашего исследования, мы выявили каналы которые влияют на рентабельность. Проверим наши выводы исключив таксичные каналы TipTop, FaceBoom и AdNonSense из выборки и посмотрим на показатели ROI.

Итоговый вывод

Мы исследовали эффективность инвистиций на рекламу в приложении **Procrastinate Pro+**. ******************* **1. Загрузка и предобработка данных:** - Мы загрузили три датасета. Файл `visits` хранит лог сервера с информацией о посещениях сайта, файл `orders` с информацией о заказах и файл `costs` с информацией о расходах на рекламу. - Проверка файлов на наличие пропусков и дубликатов, таковых не выявила. - В целях соблюдения стилистического правила, скорректировали название колонок по нижнему регистру. **2. В целях дальнейшей оптимизации расчетов написали функции для расчета показателей и составления графиков:** - Функция `get_profiles()` для создания профилей пользователей. - Функция `get_retention()` для подсчёта Retention Rate. - Функция `get_conversion()` для подсчёта конверсии. - Функция `get_ltv()` для подсчёта LTV. - Функция `filter_data()` для сглаживания данных. - Функция `plot_retention()` для построения графика Retention Rate. - Функция `plot_conversion()` для построения графика конверсии. - Функция `plot_ltv_roi` для визуализации LTV и ROI. **3. Провели исследовательский анализ, в результате которого выявили:** - Отпеределили минимальную **(01 мая 2019)** и максимальную **(27 октября 2019)** даты привлечения пользователей. Они соответствуют интервалу указанному в задаче. - Общее количество пользователей **150 008** человек. - На долю **United States** приходится **66.66%** всех пользователей, оставшиеся три региона **UK, France и Germany** можно определить как **Европа**, доли в которой распределены практически равномерно. - Доля платящих в **United States** составляет **6.9%**, что почти в **2** раза выше чем в европейских странах. - По устройствам лидируют мобильные устройства, на первом месте **iPhone** с **36,31%**, но в целом пользователи устройств на системе **iOS** являются платильщиками чаще, в среднем на **0.5%**. - **Органические** пользователи составляют **37.6%** от общего числа, из которых **2%** платильщики. - **FaceBoom** является не только лиделом среди платных каналов по количеству пользователей, их **19.4%** от общего числа, но и лиделом по соотношению платильщиков, их **12.2%**. - На **TipTop** приходится **13%** из которых **9.6%** платильщики, остальные каналы занимают доли не превышающие **5%** порог. - **5 из 10** каналов, располагаются в **United States**. Остальные каналы представлены по всей **Европе** и имеют довольно ровное распределение. **4. Проанализировали маркетинговые данные (расходы, распределения и стоимость привлечения):** - Общие расходы на рекламу составили **105 497**. - Показатель **САС** для всего пректа составил **1.12**, что свидетельствует об общей **убыточности**. - **3 из 10** каналов привличения **(TipTop, FaceBoom и AdNonSense)**, **превышают** границу рентабельности. - С мая по сентябрь, расходы на привлечение **выросли** более чем в **2 раза**. - Основное увеличение расходов отмечаем по каналу **TipTop** - На два канала лидера **TipTop и FaceBoom** приходится **82,6%** всего рекламного бюджета. **5. Проанализировали окупаемость в разрезе влияющих факторов:** - Общее **ROI** по достижению **14** дней, показывает значение **0.8** к момету рентабельности. *Реклама не окупается*. - Общее **ROI** в динамике на **14-й** день показывает снижение. В середине мая падение до уровня *себестоимости*, потом рост до уровня **1.2** на протяжении **2** недель и новое падение которое опустилось ниже уровня себестоимости, к отметки **0.9**. По итогу, с середены июля **ROI** стабильно ниже уровня рентабильности. - Общее **CAC** показывает противоположную динамику от **ROI**. В середине мая стоимость привлечения показывает резкий рост (пик приходится на дату падения в уровень себестоимости), а далее стабильный рост в течении 4 месяцев. - **ROI** привлечение для **PC** окупается уже через 11 дней. **Android** на 13 день показывает показатель в **0.9**, а пользователи **iOS** платформ не превышают показатель в **0.7**. - **CAC** с середины мая сильно вырос для **iOS** платформ, **Android** тоже подорожал но не так сильно. Стоимость привлечения пользователей на **PC** пострадала менее всего. - **ROI** в динамике на **14** день, показывает положительные показатели только у **PC**, но и они проваливаются ниже уровня во второй половине июля, потом следует подъем в течении августа и с сентября они уже тоже за порогом рентабельности. - **LTV** стабилен и самые высокие показатели у **United States** - **ROI** у **United States** не выходит за рамки себестоимости, а так как это самый многочисленный (по количеству пользователей) регион, своими убытками он перекрывает прибыть оставшихся. - **САС** у **United States** показывает резкий рост с середины июня, по **Европе** отмечаем незначительное падение с конца мая по середину июня, а далее показатель стабилен. - в динамике **ROI** на 14 день, отмечаем сильную валатильность в **UK** в июне, июле и августе, в сентябре валатильность низкая. Все европейские страны, показывают положительный показатель, что не скажешь в отношении **United States**, он стабильно за порогом рентабельности с конца мая. - **CAC** показывает ступенчатый рост по каналу **TipTop**. - **ROI** по каналам **TipTop, FaseBoom и AdNonSense** ниже себестоимости. А вот канал **YRaddit** в первую половину июля показал резкий рост. **6. Проанализировали конверсию и удержание в разрезе влияющих факторов:** - Конверсия пользователей **iOS** (iPhone и Mac) выше чем пользователей на **Android**. - В отличии от конверсии график удержания показывает противоположную картину. Пользователи **PC** и **Android** удерживаются лучше чем пользователи на **iOS** (iPhone и Mac). - Конверсия пользователей по каналу **FaceBoom** выше остальных, но как и большая часть каналов, после небольшого подъема к **2-му** лайфтайму показывает стагнацию и ложится в горизонт. - Наблюдается падение в удержании по каналам **FaceBoom и AdNonSense**. - Динамика удержания на **14-й** день показывает практически горизонтальный график по каналу **FaceBoom**, а у **TipTop** колебания от **1.5** до **3** практически каждый месяц. - Конверсия пользователей по региону **United States** выше остальных почти в **2** раза. - Динамика конверсии на **14-й** день показывает хорошую активность **United States** с середины мая и далее каждые **4** недели видим рост и падение в интервале **0.08 - 0.11**. **Европа** наоборот показывает снижение с середины мая с уровня **0.09** до интервала **0.03 - 0.06**. - Наблюдаем падение в удержании по региону **United States**, а вот **Европа** показывает более положительную динамику в среднем на **0.1** - Динамика удержания на **14-й** день по региону **United States** показывает слабую валатильность, в отличии от **Европы**. **7. Проверка гипотизы:**\ На основании полученных данных, мы можем сделать вывод, что основной причиной плохой рентабильности компании, это отрицательные показатели по трем каналам привлечения **(TipTop, FaceBoom и AdNonSense)**. В **TipTop** с июня сильно выросла стоимость привлечения **(на 350%)**, а по **FaceBoom и AdNonSense** она стабильна, но за рамками рентабельности. Дополнительный негативный фактор, это плохое удержание по каналам **FaceBoom и AdNonSense** в среднем на **0.3**.\ В целях проверки наших выводов, мы исключим **три токсичных конала** из выборки и посмотрим на экономические показатели. - Общая окупаемость наступает уже на **3** лайфтайм. - Динамика **ROI** на 14-й день тоже показывает положительный график в интервале **1.5 - 2.5** - Показатель **ROI**, даже самого *отстающего* канала, пересекает порог рентабельности уже на **5** день. - Гравик удержания по регионам показывает, что **United States** и **Европа** идут в связке. - **ROI** по **United States** окупается уже на **2-й** день, а вся **Европа** выходит в **+** уже на **5-й**. - Динамика стоимости по **United States** показывает не только более низкие значения чем в **Европе**, но тренд на снижение. - Динамика **ROI** на 14-й день по по **United States** более положительная чем в **Европе**. Таким образом наши выводы подтвердились. ************************** **Рекомендации:** 1. Пересмотреть сотрудничество с каналами **TipTop, FaceBoom и AdNonSense**, так как стоимость привлечения по этим каналам очень высокая. 2. В целом **ROI** в **United States** выше чем в **Европе**, а **САС** ниже, поэтому стоит рассмотреть деверсификацию каналов в этом регионе. Из уже действующих, можно обратить внимание на **RocketSuperAds**, доля платильщиков у него составляет **7.9%**, что говорит о более удачной выборки целевой аудитории. 3. Дополнительно изучить причину хорошей конвертации пользователей на системах **iOS**, но плохого последующего удержания, возможно причины в приложениях. Техническому отделу необходимо изучить ошибки и проанализировать отзывы. 3. Дополнительно изучить причину хорошего удержания пользователей **PC**, так как показатели **ROI** у них выше чем у мобильных устройств. Возможно функциональность приложений сильно урезана в отличии от версии для ПК. 4. Необходимо обратить внимание на **органических** пользователей, их доля от общего числа составляет **37.6%** и не смотря на низкую долю платильщиков, которая составляет **2%**, она по количеству пользователей с лихвой превышает показатели остальных каналов в среднем в **3-4** раза. Необходимо произвести опрос этих пользователей для выявления источника рекламы, это могут быть рекомендации знакомых или ресурсы не охваченные рекламой.